3 research outputs found

    Multi-document Summarization Based on Sentence Clustering Improved Using Topic Words

    Full text link
    Informasi dalam bentuk teks berita telah menjadi salah satu komoditas yang paling penting dalam era informasi ini. Ada banyak berita yang dihasilkan sehari-hari, tetapi berita-berita ini sering memberikan konten kontekstual yang sama dengan narasi berbeda. Oleh karena itu, diperlukan metode untuk mengumpulkan informasi ini ke dalam ringkasan sederhana. Di antara sejumlah subtugas yang terlibat dalam peringkasan multi-dokumen termasuk ekstraksi kalimat, deteksi topik, ekstraksi kalimat representatif, dan kalimat rep-resentatif. Dalam tulisan ini, kami mengusulkan metode baru untuk merepresentasikan kalimat ber-dasarkan kata kunci dari topic teks menggunakan Latent Dirichlet Allocation (LDA). Metode ini terdiri dari tiga langkah dasar. Pertama, kami mengelompokkan kalimat di set dokumen menggunakan kesamaan histogram pengelompokan (SHC). Selanjutnya, peringkat cluster menggunakan klaster penting. Terakhir, kalimat perwakilan yang dipilih oleh topik diidentifikasi pada LDA. Metode yang diusulkan diuji pada dataset DUC2004. Hasil penelitian menunjukkan rata-rata 0,3419 dan 0,0766 untuk ROUGE-1 dan ROUGE-2, masing-masing. Selain itu, dari pembaca prespective, metode kami diusulkan menyajikan pengaturan yang koheren dan baik dalam memesan kalimat representatif, sehingga dapat mempermudah pemahaman bacaan dan mengurangi waktu yang dibutuhkan untuk membaca ringkasan

    Segmentation of Overlapping Cervical Cells in Normal Pap Smear Images Using Distance-Metric and Morphological Operation

    Get PDF
    The automatic interpretation of Pap Smear image is one of challenging issues in some aspects. Accurate segmentation for each cell is an important procedurethat must be done so that no information is lost during the evaluation process. However, the presence of overlapping cells in Pap Smear image make the automated analysis of these cytology images become more difficult. In most ofthe studies, cytoplasm segmentation is the difficult stage because the boundaries between cells are very thin. In this study, we propose an algorithm that can segment the overlapping cytoplasm. First, the morphology operation and global thresholding to segment cytoplasm is done. Second, the overlapping area on cytoplasm region is separated using morphological operation and distance criteria on each pixel. The proposed method has been evaluated against the results of manual tracing by experts. The experiment results show that the proposed method can segment the overlapping cytoplasm as similar as experts do, i.e., 2:897 3:632 (mean std) using Hausdorff distance
    corecore